Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank

Abstract

语义词空间很有用,但是没有办法表达长词组的意思。提出了Recursive Neural Tensor Network,这个模型可以捕捉到否定词的影响。

Introduction

现有的模型难以学习组合词语,这是由于缺乏标注好的组合词词库。Stanford Sentiment Treebank是第一个在语法树上带标注的语料库。

Related Work

涉及到了五个方面的工作

  1. Semantic Vector Spaces
  2. Compositionality in Vector Spaces
  3. Logical Form
  4. Deep Learning
  5. Sentiment Analysis

Stanford Sentiment Treebank

之前用的最多的是Bag of words classifiers但是这个对于单个句子的情感分析准确率从没超过80%。在像对twitter这样的短文本进行分析的时候,准确率也通常不到60%。

他们观察到长的短语通常容易包含情感,越短包含的越少。

Recursive Neural Network

分享到